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基于 改进 的 TLD 目标 跟踪 算 ; 


(长 安 大 学 电子 与 控制 工程 学 院 , 西安 710064) 


摘 要 : 针对 传统 跟踪 一 学 习 一 检测 (tracking-learning-detecting，TLD) 目标 跟踪 算法 由 于 检测 模块 扫描 大 量子 窗口 而 
导致 检测 时 间 过 长 ， 并 且 在 跟踪 过 程 中 当 目 标 发 生 严重 遮挡 、 形 变 时 ，TLD 算法 会 出 现 跟 踪 失 败 的 问题 进行 了 研究 ， 
提出 改进 TLD 目标 跟踪 算法 。 改 进 算法 在 检测 模块 前 如 入 ViBe 模型 预 估 前 景 目标 ， 极 大 地 缩小 了 检测 区 域 。 追 踪 模 
块 用 SIFT 特征 匹配 算法 来 代替 原 算 法 中 的 光 流 法 ， 准 确 跟踪 目标 避免 发 生 跟踪 漂移 ,减少 了 计算 的 复杂 度 ， 提 高 了 算 
法 适应 环境 的 能 力 。 实 验 表 明 ， 改 进 后 的 TLD 算法 运行 速度 得 到 提升 ， 并 且 当 目标 出 现 严重 遮挡 、 光 照 强度 剧烈 变化 
时 的 跟踪 精度 也 得 到 了 很 好 的 改善 
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Target tracking algorithm based on improved TLD 


Hu Xin, Gao Jiali 
(School of Electronics & Control Engineering, Chang'an University, Xi’"an 710064, China) 


Abstract: Aiming at the problems of that the detecting module scans a large number of sub windows, which result the detection 


time is too long , and when the target has severious occlusion and deformation during the tracking process, the traditional 


tracking learning detection (TLD) target tracking algorithm will fail to track, so this paper propose the improved TLD target 


tracking algorithm. Before the detection module, it added the ViBe model to estimate the foreground target, which greatly 
reduces the detection area. The tracking module uses the Sift feature matching algorithm to replace the optical flow method in 
the original algorithm, accurately tracking the target to avoid the tracking drift, reducing the complexity of the calculation and 
improving the ability of the algorithm to adapt to the environment. The experiment results show that the improved TLD algorithm 
can improve the running speed, and the tracking accuracy can also be improved when the target is seriously occluded and the 


light intensity changes dramatically. 


Key words: TLD algorithm; ViBe algorithm; SIFT feature matching algorithm; tracking drift 


跟踪 器 的 目标 跟踪 算法 首先 假设 目标 在 视野 中 一 直 处 于 可 见 状 

态 , 如 果 目 标 消 失 或 者 发 生 遮 挡 , 视频 目标 跟踪 就 会 失败 中 , 该 

计算 机 视觉 广泛 应 用 于 人 们 的 日 常生 活 中 ， 在 计算 机 视 方法 具有 很 大 的 局 限 性 ， 被 认为 是 短期 的 跟踪 器 ， 不 可 以 用 于 
研究 领域 ， 目 标 跟 踪 技 术 一 直 都 是 热点 课题 ， 在 实际 应 用 中 ， 长 时 间 的 视频 目标 跟踪 。 基 于 检测 器 的 目标 跟踪 算法 ， 该 方法 
如 何 根据 视频 连续 帧 中 的 目标 状态 准确 的 估计 出 目标 的 位 置 、 对 视频 中 的 目标 跟踪 是 通过 滑动 窗口 来 扫描 每 一 帧 图 像 ， 但 是 
轨迹 已 成 为 研究 数字 图 像 处 理 领 域 的 热点 问题 。 目前 , 目标 跟 ” 该 算法 的 缺点 是 要 提前 挑选 大 量 的 被 样本 用 来 检测 和 学 习 ， 因 
踪 技 术 已 广泛 应 用 于 自动 视频 监控 、 汽 车 导航 、 智 能 机 器 人 导 ”此 此 类 方法 也 不 能 很 好 的 应 用 于 长 期 目标 检测 外 。 在 长 期 的 目 
航 与 定位 、 人 机 交互 、 智 能 交通 系统 、 无 人 机 目标 追踪 以 及 视 。 标 跟踪 过 程 中 使 用 单纯 的 目标 跟踪 或 者 目标 检测 技术 ， 都 很 难 
频 检索 等 领域 中。 现 如 今 , 经 过 很 多 学 者 的 研究 , 视频 目标 跟踪 ”得 到 理想 的 效果 。 因 此 ， 考 虑 将 目标 追踪 算法 和 目标 检测 算法 
技术 已 经 相对 成 熟 ， 并 且 取 得 了 更 大 的 进展 ， 国 内 外 的 学 者 对 相 结 合 ， 当 待 追踪 目标 发 生 谈 挡 或 者 目标 消失 导致 系统 跟踪 失 
目标 跟踪 技术 的 研究 也 越 来 越 重视 。 败 的 时 候 ， 就 可 以 利用 检测 器 检测 到 出 现 的 目标 四， 然后 用 追 
前 传统 的 跟踪 算法 可 以 分 为 两 类 ， 一 类 是 基于 跟踪 器 的 。” 踪 器 重新 进行 跟踪 ， 从 而 就 有 学 者 提出 了 TLD 目标 跟踪 算法 ， 
目标 跟踪 算法 ， 另 一 类 是 基于 检测 器 的 目标 跟踪 算法 外 。 基 于 ”该 算法 结合 了 传统 的 目标 检测 技术 和 目标 跟踪 技术 ， 解 决 了 被 
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跟踪 目标 在 跟踪 过 程 中 发 生 的 形 
并 且 加 入 了 一 种 改进 的 在 线 学 习 机 种 


变 光照 
dig, 


` 以 及 部 分 遮挡 
从 而 使 得 整个 系统 更 


问题 ， 


加 的 稳定 、 可 靠 。 但 是 对 于 经 典 TLD 


标 追 踪 算 法 ， 由 于 检测 


模块 扫描 得 到 的 子 窗口 数目 
统 运 行 效率 。 并 且 当 目标 出 现 严 重 遮 挡 、 
会 出 现 跟踪 失败 的 问题 ， 


py 


1 TLD 目标 追踪 算法 


TLD 目标 追踪 算法 
单 目标 长 期 


元 


过 大 ， 导 致 检测 时 间 过 长 ， 
形变 、 
提出 了 本 文 的 改进 方法 。 


Kalal 等 人 在 2012 年 提 
目标 跟踪 算法 。 该 算法 主要 由 追踪 模块 、 学 习 模 块 、 


影响 系 
光照 变化 时 都 


出 的 一 种 


检测 模块 、 综 合 模块 组 成 四。 算法 框架 结构 如 


局 


图 1 所 示 。 
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图 1 TLD 算法 框架 结构 图 
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胡 有 欣 ， 等 : 基于 改进 


TLD 学 习 模 块 采 


学 习 根 


利 ) 
N 专 


1.3 


在 当 
联 分 


该 算法 的 具体 执行 过 程 为 : 首先 输入 一 段 视频 序列 ， 在 视 


频 


第 一 帧 中 手动 将 待 追 踪 的 目标 区 域 定位 名 ， 


测 学 习 追 踪 模 块 中 。 跟 踪 器 通过 连续 两 帧 间 的 运动 


动 目 标的 状态 ， 但 是 跟踪 器 会 在 
败 。 检 测 器 对 每 一 帧 图 像 进行 扫描 ， 
过 和 目标 具有 类 似 模样 的 所 在 区 
线 处 理 
种 错误 进行 评估 ， 
的 目标 模型 进行 更 新 。 
结果 一 同 输入 到 综合 模块 ， 
1.1 跟踪 模块 


且 根 据 评 


得 到 待 追踪 目标 。 


目标 跑 出 摄像 头 范 转 
找到 所 有 已 经 被 观测 学 习 
或 。 学 习 模 块 通 
提升 检测 器 的 性 能 ， 根 据 跟 踪 模 块 的 结果 对 检测 器 的 两 
右 结果 生成 训练 样 
最 后 将 跟踪 模块 和 检测 模块 得 到 的 追 


之 后 并 行 送 入 检 
言 息 检测 运 
目 时 跟踪 失 


过 对 视频 的 在 


本 对 检测 模块 
踪 


为 了 筛选 出 可 靠 的 跟踪 点 , 跟踪 器 采用 LK(Lucas-Kanade) 


光 流 法 
理 图 如 图 2 所 示 ， 采 用 前 向 后 向 误差 法 来 预测 
有 正 反 向 连续 性 00。 即 从 时 间 
的 位 置 YX 二 K) ， 再 
间 t 的 预测 位 置 x(1) ， 这 种 前 
移 偏差 ， 称 为 前 后 向 误差 [1。 


的 特征 点 ， 计 算 新 的 目标 窗 


从 位 


位 置 ， 完 成 


后 向 轨迹 


前 后 向 误差 


1 的 初始 位 置 x(7?) 开 


改进 后 的 中 值 流 跟踪 算法 (median-flow) 00。 该 算法 原 


目标 的 位 置 ， 
始 追踪 产生 


前 向 后 向 轨迹 光 流 预测 原理 


LX(f 十 有) 反 向 追踪 产生 时 
向 后 向 轨迹 预测 可 以 得 到 一 个 位 


三 部 


入 级 联 分 类 器 。 其 中 ， 方 差 滤 波 器 利 ) 
方差 小 于 被 跟踪 图 


除去 


框 送 到 外 


家 找 出 


不 带 标 签 样本 


在 线 处 理 提升 检 六 
正 负 样 本 , 不 断 更 
居 带 标签 样 


1 P-N 半 监 督学 
| 器 的 性 能 


习 方 法 , 通过 对 每 一 帧 图 
。 根 据 输 入 的 检测 


结 


合作 期 于 


IV 
的 TLD 目 | 


法 


A 
条， 产生 


新 检测 器 .P-N 学 习 的 原理 如 图 
本 监督 学 习 训练 得 到 初始 分 类 器 ， 之 后 
和 欠 代 学 习 得 到 新 的 分 类 器 对 未 标签 样 
背 误 分 类 的 样 
后 得 到 的 分 类 器 性 能 更 好 [9 。 


本 修正 


本 数据 进行 
训练 样本 集 ， 


中 分 类 器 


带 标签 样本 


训练 集 


训练 


3 所 示 ， 


分 类 。P- 


下 一 次 迭 代 


分 类 器 参数 


标签 


负 样 本 


P-N 约 束 


正 样本 


检测 模块 


图 3 P-N 学 习 原 理 


检测 器 根据 


标 模型 ， 


前 帧 中 可 


类 器 ， 主 要 


分 组 成 D31。 通 过 


通过 之 前 的 学 习 和 观测 来 定 
能 出 现 的 位 置 。TLD 算法 中 的 检测 器 采用 的 是 级 
方差 滤波 器 、 集 成 分 类 器 以 及 最 近 


不 同 尺 寸 的 滑动 窗口 扫描 得 


到 的 


位 目标 


邻 分 类 器 
抢 形 框 送 


是 包含 


今 


度 。 相 关 相 


如 图 


4 所 示 。 


积分 图 
像框 方差 的 50% 的 矩形 框 。 
尾 成 分 类 器 ， 平 均 后 验 概率 大 于 50% 的 拢 
标的 图 像框 


多 杠 


计算 像素 方差 ， 
剩 下 


的 矩形 
则 被 认为 


。 对 于 剩 下 的 矩形 框 ， 计 算 其 相关 相似 
似 度 大 于 0.65 的 即 为 最 终 的 前 景 目标 。 检 测 器 原理 


建立 网 络 方差 滤波 器 


| 可 


中 “特征 提取 六 


集成 分 类 器 一 >| 最 近邻 分 类 器 一 > 


目标 图 像 


1.4 


合 。 如 果 两 个 模块 都 没有 得 到 
人 否则， 就 将 具有 最 大 


有 出 
位 置 


对 于 前 后 向 误差 值 小 于 中 值 50% 
次 短 


期 跟踪 。 


tt 


2 


2.1 


并 证 


| 


| | 


| 


被 拒 区 域 


综合 模块 
TLD 综合 


图 4 TLD 检测 器 原理 


模块 将 检测 模块 和 跟踪 模块 得 到 的 结果 进行 整 


现 。 


TLD 目标 追 


检测 模块 的 改进 
经 典 TLD 


大 和 4 


大 量子 窗口 ， 


跟踪 算法 检测 模块 对 每 
目 大 多 数 的 子 窗 口 


个 过 程 使 得 系统 的 检测 时 间 过 长 。 其 次 ， 将 整 幅 


自 踪 算法 的 改进 


标 框 ， 就 表明 当前 帧 中 


标 没 


保守 相似 度 的 作为 最 终 


顺 医 


标 框 的 


像 进行 全 局 扫描 ， 


不 包 全 


用 ER 


标 ， 这 


联 分 类 器 进行 检测 ， 增 加 了 算法 的 复杂 度 ， 


时 性 变 差 。 可 以 考虑 采用 


出 更 


标的 图 像 块 传 入 方差 滤波 器 ， 最 终 成 


所 图 


Vibe 算法 进行 前 景 


功 通过 


标 检 测 ， 


像 送 入 级 


使 得 整个 过 程 的 实 


将 含有 


整个 级 联 分 
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类 器 的 图 像 块 就 是 


标 图 像 块 ， 减 少 了 检测 器 扫 


描 的 子 密 


数 


景 检 测算 法 ， 其 实时 | 
个 像素 点 存储 其 历史 
入 新 像素 值 和 样本 集 
三 个 方面 : 


， 提 高 了 级 联 分 类 器 的 效率 09。Vibe 算法 是 一 种 像素 级 的 前 


性 高 ， 检 测 准确 。 该 算法 的 思想 是 : 给 每 
像素 值 和 邻 域 像素 值 作为 样本 集 ， 对 比 输 


判断 其 是 否 为 背景 点 03。 该 算法 主要 包括 


a) 初始 化 单 帧 图 像 中 每 个 像素 点 的 背景 模型 。 选 取 每 帧 图 


像 中 像素 点 的 8 邻 域 像 素 值 ， 对 


该 像素 点 处 的 背景 模 


b) 对 后 续 的 图 像 序列 进行 前 景 目 


值 和 背景 模型 中 采样 


其 随机 抽样 20 次 作为 下 一 帧 


型 。 


内 8 个 方向 的 梯度 累加 值 ， 即 可 形成 128 维 


子 [7, 


3 实验 


胡 


结果 


ChinaXiv 合 作 其 


明天 
于 改进 的 TLD 目标 跟踪 算法 


欣 ， 等 : 基 


格 


的 SIFT 特征 扫 


实验 以 Visual Studio 2013、OpenCV 3.0.0、MATLAB 2016a 


作为 开发 平台 ， 在 Windows 7 
6200U CPUG@ 2.30 GHz 


进行 测试 。 


标 分 割 操作 。 计 算 新 像素 
点 的 距离 ， 如 果 距 离 小 于 姜 值 的 个 数 大 于 


2， 就 判定 新 的 


C 


Nt 


5 晶 . 
月 慰 


有 1/9 的 概率 对 背 
模型 中 的 一 
背景 模型 ， 


2.2 


点 


在 8 邻 域 


经 
法 使 用 的 前 提 是 假设 
光源 、 噪 声 的 存在 ， 
化 很 容易 造成 目标 丢 
时 ， 光 流 法 会 很 难 形 
致 跟踪 失败 。 因 此 ， 
标 ， 该 算法 具有 很 强 
度 、 平 面 旋转 、 目 标 
变化 很 大 在 某 种 程度 


像素 点 为 背景 点 ， 并 且 
背景 模型 更 新 阶段 。 


个 采样 点 。 


追踪 模块 的 改进 
TLD 算法 的 跟踪 模块 采用 


更 新 背景 模型 。 

如 果 某 个 像素 被 认为 是 背景 点 ， 就 
模型 更 新 ， 更 新 时 随机 等 概率 的 更 新 背景 
同时 也 有 1/9 的 概率 更 新 邻 域 像素 点 的 
样本 集中 随机 选择 像素 值 进行 填充 更 新 。 


的 是 改进 后 的 光 流 法 , 光 流 
恒 ， 但 在 实际 应 用 中 ， 由 于 遮挡 、 
亮度 守恒 定律 一 般 不 满足 ， 较 大 的 光照 变 
失 。 其 次 ， 当 目标 平面 旋转 导致 目标 形变 
成 运动 矢量 场 ， 将 无 法 确定 目标 位 置 ， 导 
跟踪 模块 采用 Sift 特征 匹配 算法 来 跟踪 目 
的 匹配 能 力 ， 很 容易 处 理 双 帧 图 像 ， 对 亮 
形变 具有 不 变性 ， 即 便 是 图 像 的 拍摄 角度 
上 也 能 够 稳定 的 实现 特征 匹配 09。 利 用 该 


亮度 守 


在 实际 应 用 中 可 
以 下 四 步 : 
) 尺 度 空 


算法 


分 解 为 


已 


间 极 值 检测 。 


以 比较 准确 的 追踪 到 目标 。Sift 算法 可 以 


二 维 图 像 ICcy) 在 不 同 尺 度 下 的 


空间 可 由 图 像 I(x,y) 与 高 
的 DoG(Difference of Gaussian) 人 金字塔 ， 


斯 核 函数 G(x,y,o) 卷 积 得 到 。 建 立 图 像 
在 DoG 尺度 空间 的 26 


个 邻 域 检测 极 值 。DOG 算 子 定义 如 下 : 


D(x, y,0)= 


其 中 :o 为 尺度 因 
度 间 的 比例 因子 。 


于， 


pb) 关键 点 位 置 及 尺度 确定 


低 、 边 缘 不 稳定 的 关 


(G(X, 了》， Ka ) G(X, 了》， 0))* T(x, y) 
= L(x,y,ko)—L(x, yO) 


L(x,y,0) 表 示 图 像 的 尺度 空 


(1) 


间 ，k 为 相 邻 尺 


。 依 据 稳定 程度 ， 去 除 对 比 度 较 


键 点 。 


9) 关键 点 方向 确定 。 可 
。 每 个 点 L(x,y) 梯 度 的 模 m(x,y) 和 方向 9(x,y) 计 算 如 下 : 


以 通过 邻 域 像素 的 梯度 分 布 特性 确 


m(x, y) = VLCx t 


O(x,y 


d) 关 键 点 描述 。 将 多 


转 不 变性 。 取 特征 点 


后 将 16*16 的 方形 区 


2) 


[L(x,y+D) -L(x,y-—DY 
1 L(x, y+1)—L(x,y—1) 
L(x+1,y)—L(x—1,y) 
标 轴 旋 转 到 特征 点 的 主 方向 以 保证 旋 
16*16 的 邻 域 生成 该 特征 点 的 描述 符 ， 之 
域 分 成 16 个 4*4 的 子 块 ， 计 算 每 个 子 块 


1,y) -Lx-1, yy) 


)=tan 


wp 
里 。 


系统 ， 处 理 器 Intel%) Core™ i5- 
有 脑 上 进行 测试 。 实 验 共用 了 Visual 
Tracker Benchmarks 中 的 4 个 测试 集 对 TLD 及 改进 
表 1 对 比 了 TLD 算法 与 改进 TLD 算法 
表 2 对 比 了 TLD 算法 与 改进 TLD 算法 的 跟踪 速度 。 


TLD 算法 
的 扫描 窗口 


Eg 


表 1 TLD 算法 与 改 ; 


站 ITLD 算法 扫描 


数量 


测试 引 


TLD 


uy 


改进 TLD 


减少 比例 


David 
Football 
FaceOcc2 


Jumping 


74329 
218965 

71045 

99683 


12156 

53178 
8248 

41763 


6.11 
4.12 
8.63 
2.38 


表 2 TLD 算法 与 改进 TLD 


法 跟踪 速度 


测试 


集 视频 总 帧 数 


TLD( 帧 /s) 


改进 TLD ( 帧 /s) 


David 
Football 
FaceOcc2 


Jumping 


770 
362 


10.7 
12.3 
14.3 
16.4 


19.5 
18.6 


对 于 David 视频 集 ， 对 比 原始 算法 和 改 


减少 了 6 倍 左右 ， 
于 Football 视频 集 ， 
了 4 倍 左 右 ， 跟 踪 速 度 
攻 ， 对 比 原始 算法 和 改进 算法 ， 密 
提升 到 了 21.8 帧 /s; 
对 比 原始 算法 和 改进 算法 ， 
到 了 23.2 帧 /$。 
前 景 目标 预 


FaceOcc2 视频 集 ， 
8 倍 左右 ， 跟 踪 速 度 


Football 
倍 左右 ， 


和 表 2 可 以 看 到 采用 


12. 


对 比 原始 


跟踪 速度 由 10.7 帧 /s 提升 到 了 19.5 帧 /s; 


进 算法 ， 多 数 耳 
对 


3 帧 /s 提升 


算法 和 改进 算法 ， 窗 
到 了 18. 


口 数 量 减 少 


6 帧 /s; 对 于 


世 由 14. 


3 帧 /s 


视频 集 ， 
跟踪 速度 也 


16.4 
了 Vibe 


的 减少 了 扫描 子 窗口 数目 ， 
了 整个 系统 的 工作 效率 。 提 高 系统 运行 速 


算法 


陆 /s 提升 


窗口 数量 减少 了 4 


进行 


且 提 


估 之 后 , 大 量 


高 了 算法 的 运行 速度 ， 增 强 
度 的 同时 


还 应 该 考虑 


目标 追踪 的 准确 度 ， 表 3 对 比 了 TLD 算法 和 改进 TLD 算法 成 
功 跟踪 的 目标 帧 数 。 
表 3 TLD 算法 与 改进 算法 成 功 跟踪 目标 帧 数 

视频 库 视频 总 帧 数 TLD 改进 TLD 

David 770 628 698 

Football 362 164 325 

FaceOcc2 812 729 812 

Jumping 313 302 313 

由 于 SIFT 特征 是 图 像 的 局 部 特征 ,其 具有 一 定 的 不 变性 。 
当 平 面 发 生 旋转 、 遮 挡 、 尺 度 变化 和 亮度 变化 时 ， 所 以 利用 该 
特征 匹配 算法 改进 原始 算法 。 对 于 David 视频 测试 集 ， 在 追踪 
过 程 中 目标 发 生 了 强烈 的 光照 变化 、 以 及 目标 姿态 变化 导致 的 
平面 旋转 、 目 标 被 遮挡 的 问题 ，TLD 算法 追踪 到 了 628 帧 ， 改 
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进 TLD 算法 追踪 到 698 帧 。 对 于 Football 测试 集 ， 在 追踪 
中 ， 目 标 发 生 了 严重 的 形变 、 迹 挡 问 题 ， 并 且 


目标 消失 重新 出 
现在 视野 ，TLD 算法 跟踪 效果 较 差 ， 只 成 功 跟 踪 了 164 帧 ， 而 
改进 TLD 算 跟 踪 效 果 较 好 , 成 功 跟踪 了 325 帧 。 对 于 
测试 集 , 跟踪 过 程 中 目标 发 生 了 目标 遮挡 、 平 面 旋转 问题 , TLD 
算法 追踪 到 729 帧 ， 而 改进 TLD 算法 成 功 追 踪 到 每 一 帧 的 
标 。 对 于 Jumping 测试 集 ， 跟 踪 目 标 出 现 了 光照 变化 ， 摄 像 头 


上 FaceOcc2 


抖动 问题 ，TLD 算法 成 功 追踪 了 302 帧 ， 改 进 TLD 和 


追踪 到 每 一 帧 目标 。 


:ChinaX iv 合作 期 于 


胡 欣 ， 等 : 基于 改进 的 TLD 目 其 和 


减少 了 待 检 测 的 样本 数量 ， 既 保证 了 目标 的 跟踪 精度 ， 还 加 快 
了 检测 模块 的 运行 速度 ， 提 高 了 整个 系统 的 运行 效率 。 改 进 后 
算法 在 跟踪 模块 采用 SIFT 特征 匹配 算法 , 由 于 其 对 视角 变化 、 
仿 射 变换 、 光 照 变化 具有 一 定 的 稳定 性 ， 所 以 很 好 地 解决 了 原 
TLD 算法 的 跟踪 漂移 问题 。 相 对 于 原始 的 TLD 算法 ， 改 进 后 
算法 的 跟踪 效果 明显 加 强 。 但 是 本 文 算 法 性 能 虽然 有 所 提升 ， 

但 还 存在 不 足 之 处 , 如 在 检测 模块 之 前 加 入 了 Vibe 前 景 检测 算 
法 ， 增 加 了 检测 模块 在 整个 算法 的 比例 ， 就 会 影响 整个 系统 的 


踪 效 果 图 ， 追踪 目标 是 运动 员 队 服 上 的 号 码 24。 
TLD 算法 的 追踪 结果 ， 红 色 框 为 改进 TLD 算法 的 i 


图 5 为 测试 集 Football 传统 TLD 算法 和 改进 TLD 算法 i 


其 中 了 


对 于 此 测试 集 视频 流 初始 阶段 ,手动 定位 要 追踪 
(a) 是 在 开始 的 第 138 帧 时 , 两 种 算法 都 成 功 的 追踪 到 


的 目标 。 其 


《bp ) 是 在 200 帧 时 ,运动 员 快 速 移动 ,导致 目标 
且 目 标 被 严重 遮挡 ， 此 时 TLD 算法 跟踪 目标 失败 ， 而 改进 
TLD 算法 成 功 追 踪 到 目标 ; (c) 是 第 362 帧 时 , 追踪 目标 被 4 
部 遮挡 且 目 标 消 失重 现时 ，TLD 算法 出 现 了 跟踪 框 漂移 现象 ， 


跟踪 失败 。 而 改进 TLD 算法 成 功 追 踪 到 目标 。 
了 A 4 SI 忆 EY "| 


(ce)362 帧 


图 6 采 


de 


算法 的 追踪 结果 , 红色 框 代表 改进 TLD 算法 追踪 台 
时 先 手动 定位 日 标 ， 图 中 ，(a) 是 第 60 帧 时 


图 5 传统 TLD 算法 和 改进 TLD 算法 追踪 效果 对 比 图 
摄像头 模式 来 追踪 作者 的 嘴巴 , 黄色 


匡 代 表 TLD 
吉 果 。 初始化 
两 种 算法 的 追 


了 目标 ; 
bh 现 平面 变化 ， 


et 


aa 


结果 ， 可 以 看 到 TLD 算法 和 改进 算法 都 成 功 追 踪 到 


(b) 是 183 帧 时 作者 用 手 遮 住 嘴 巴 ，TLD 算法 跟踪 过 程 中 
现 跟踪 框 漂移 到 作者 的 脸 部 的 现象 ， 跟 踪 失 败 。 但 是 改进 TLD 


算法 能 够 成 功 追 踪 到 目标 ; (c) 是 当 背 景 发 生 强 烈 光 照 变 


TLD 算法 跟踪 失败 ， 而 改进 TLD 算法 成 功 追 踪 到 目标 。 
4 ”结束 语 
传统 的 TLD 目标 跟踪 算法 可 以 在 先 验 信息 较 


现 长 时 间 的 在 线 目 标 追 踪 ， 其 跟踪 速度 比较 快 ， 
且 当 目标 消失 重 现 后 也 能 很 好 地 追踪 到 原 目标 。 


少 的 时 候 实 


et 


sd 


实时 性 高 ， 


进 后 算法 输 


入 至 检测 模块 前 采用 了 ViBe 算法 进行 前 景 目标 预 估 ， 


办 调 性 。 而 且 对 于 学 习 模块 ， 如 何 加 强 学 习 和 提升 学 习 精 确 度 
和 灵敏 度 问 题 ， 都 是 待 研究 的 方向 。 


(a) 60 帧 (b) 183 帧 


(c)267 帧 


对 


图 6 传统 TLD 算法 和 改进 TLD 算法 追踪 效果 对 比 
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